Колко добър е видеомоделът Sora на OpenAI — и ще трансформира ли работните места?
OpenAI показва Sora, своя модел за генериране на видео с изкуствен интелект, на ръководители на медийната промишленост през последните седмици, с цел да разсъни възторг и да облекчи опасенията по отношение на капацитет за технологията да наруши избрани браншове.
Файненшъл таймс искаше да подложи Sora — и нейните съперници — на тестване.
Помолихме ръководители в региона на рекламата, анимацията и недвижимите парцели да напишат подкани за генериране на видеоклипове, които биха могли да употребяват в работата си. След това ги попитахме за мнението им за това по какъв начин сходна технология може да промени работата им в бъдеще.
Sora към момента не е пусната за обществеността, тъй че OpenAI промени някои от подканите, преди да изпрати получените клипове. На Runway и Pika първичните и изменени подкани бяха въведени благодарение на най-модерните модели на двете компании. Ето резултатите.
Шарлот Бъниан, съосновател на Arq, съветник по реклама на марки
Ревизираната версия на OpenAI на подканата на Бъниан да създайте акция за „ добре прочут супермаркет на основната улица “:
ExpandExpand
Описание на видеоклип
Генерирано от AI видео, основано по модифицирана подкана от OpenAI.
© Sora/Pika/Runway
Видеоклиповете на Pike и Runway въз основа на истинската подкана на Bunyan:
ExpandExpand
Описание на видеоклипа
Видео, генерирано от AI въз основа на истинската подкана.
© Sora/Pika/Runway
„ Представянето на хората от Сора беше поредно, до момента в който действителната визуализация на фантастичната детска площадка беше правилно показан във връзка с описанията на другите детайли, които другите не съумяха да генерират.
„ Интересно е, че OpenAI промени „ деца “ на „ хора “ и бих желал да знам за какво. Въпросът за отбрана ли е? По-трудно ли е да се показват деца, тъй като те не са били подготвени на толкоз доста? Те избраха „ хора “, а не кавказки мъж с брада и кафява коса, което в действителност генерира Сора, което повдига въпроси по отношение на пристрастието.
„ Пика се почувства сюрреалистично, като че ли се намирате в миг от филм. Детската версия е доста по-добра от сюрреалистичността на Лигата на джентълмените на итерацията за възрастни, само че в останалата част от средата липсват детайлности от подканата. Наистина изпитвам известна обвързаност към жизнеността на версията [на Пика за деца], защото тя предава чувство за наслада и благополучие по-силно от всяка друга. “
„ Пистата беше доста по средата. Разбира се, във версията за възрастни имаше по-малко проблеми, само че представянето на детайлите на детската площадка липсваше.
„ Потенциално бих могъл да употребявам видеоклипа на Sora като дегустация на нещо, което бихме могли да съживим във виртуален опит. Това би демонстрирало игривостта на храната. Въпреки това може да се наложи да добавите човешки пласт към наличието, като употребявате принадлежности за редактиране.
„ Тези принадлежности ще ускорят метода, по който предаваме креативен хрумвания и ще ги създадат по-осезаеми. Например, в ранните стадии на показване на идея на марка, това би улеснило клиентите да схванат по какъв начин може да наподобява или по какъв начин би работила.
„ Моята подкана съдържа нереални креативен концепции които са по-трудни за тези принадлежности. Често в света на творчеството се пробвате да създадете нещо, което не е съществувало преди. Знам, че има огромна угриженост и може би негативност по отношение на това, че AI заема всичките ни работни места, само че мисля, че би трябвало да обмислим по какъв начин AI ще улесни работата ни и ще облекчи някои тежести. “
Алекс Уилямс, аниматор, чиито заеми включват „ Кой подреди заека Роджър? “ и „ Цар Лъв “
Видеоклипове, генерирани от модифицираната подкана на OpenAI:
ExpandExpand
Описание на видеоклипа
Видео, генерирано от изкуствен интелект въз основа на модифицирана подкана от OpenAI.
© Sora/Pika/Runway
„ То има това леко превръщане, което има работата, генерирана от AI, което не мисля, че към момента го прави подготвен за клиент, само че това е нещо, което ще бъде изгладено.
„ Всеки един е необикновен във връзка с това, което по този начин е, само че всеки [има] явни грешки ... като глави, изменящи формата си и фламинго, смесващи се с други фламинго — към момента не работи. “
„ Не съумя да създаде къс филм с начало, среда и край, тъй че не съумя направи това, което се надявах да стане. От друга страна, това, което прави във връзка с анимацията, е доста впечатляващо.
„ Откакто започнах да се занимавам с анимация през 80-те години, някои доста обилни софтуерни достижения трансформираха доста средата. Няма подозрение, че това е най-голямата смяна, която съм виждал в кариерата си.
„ Бих направил съпоставяне с прекосяването от 2D към 3D анимация, което се случи в края на 90-те, когато излезе „ Играта на играчките “.. В началото имаше огромна опозиция измежду общността на ръчно рисуваната анимация против тези промени, в това число и мен.
„ Отне ми няколко години, с цел да схвана, че би трябвало да прегърна тази смяна. Всички дружно се борихме с него за известно време, само че той се трансформира в огромния касов мотор. Като промишленост ние в действителност би трябвало да прегърнем технологиите, тъй като в никакъв случай не желаете да застанете на неверната страна. “
Ашли Шакибай, индустриален управител в сътрудници за търговски недвижими парцели OBI Собственост
Видеоклипове, генерирани от подкана за промоционален видеоклип на комерсиална постройка в Манчестър:
ExpandExpand
Описание на видеоклипа
Видео, генерирано от AI въз основа на истинската подкана.
© Sora/Pika/Runway
„ Сора свърши рационална работа първоначално. Преходът постоянно ще бъде сложен и той се бореше с това. Но мисля, че фотореализмът в края на фрагмента беше много прелестен и неочакван.
„ Технически подканата беше, че хората вървят в постройката, само че това не беше показано и имаше доста други детайли не реализира.
„ Всичко, което Pika събра от подканата ми, е „ безоблачен ден “. Даде ни няколко ракети и няколко здания, само че не можете да различите хората. “
„ Трябваше да се дръзвам, когато гледах този Runway. Има малко повече фотореализъм, само че хората вървят напред и след това обратно, тъй че сигурно не е правдоподобна сцена.
„ Като експерт в промишлеността упованията ми са съвършенство. Търся видео с реалистично качество и изкуственият разсъдък евентуално в никакъв случай няма да стигне до такава степен.
„ В края на видеоклипа на Sora двойката беседва в кафене, изглеждайки по този начин, като че ли се забавляват. Това би бил късмет, който бихме употребявали, с цел да продадем пространство за комерсиална благосъстоятелност като улеснение наоколо.
„ В последна сметка ще достигнем точка, в която това е необикновено мощен инструмент за създателите, неизбежно елиминиращ потреблението на други принадлежности. Sora ще провокира съществено борсовите уеб страници и ролята на актьорите, които използваме в този момент.
„ Трябва да сте доста деликатни, когато добавяте компютърно генерирани изображения. Ако не е за, в случай че не е правдоподобно, може да бъде прекомерно разсейващо. Много е на стадий тестване. “
Допълнителен репортаж от Madhumita Murgia